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西南 牡 萝 叶 绿 体 基 因 组 特征 及 系统 发 育 分 析 
EGF. KWR, FW ARI 
《大 理 大 学 农学 与 生物 科学 学 院 ， 云 南 大 理 671003) 

Jj XE. 为 探究 西南 牡 芍 的 〈4rtemisia parviflora) 叶绿体 基因 组 结构 特征 及 其 系统 位 置 ， 
玄 研 究 利 用 高 通 量 测序 技术 对 其 进行 测序 , 并 借助 生物 信息 学 工具 进行 分 析 。 结 果 表 明 : (1) 
西南 牡 萝 叶绿体 基因 组 长 151 047 bp， 呈 现 为 由 四 部 分 组 成 的 环 状 双 链 结构 ，GC 含量 为 
37.5%。 〈2) 共 注 释 115 个 基因 ， 包 括 81 个 蛋白 编码 基因 、4 个 IRNA 基因 及 30 个 tRNA 
基因 。 G) 检测 到 es 个 简单 重复 序列 (SSRs) 和 37 个 长 重复 序列 。 (4) 西南 牡 蒿 叶 绿 
体 基因 组 的 密码 子 使 用 偏 性 较 弱 ， 其 主要 受 自 然 选 择 的 影响 ， 高 频密 码 子 偏 向 以 A/U 结尾 。 
(5) 西南 牡 蒿 叶绿体 基因 组 的 IR. 区 未 出 现 明 显 的 扩张 或 收缩 ， 筛 选 出 了 trnH-psbA « 
rpl116-rps3、ycf15-trnL-UAG、ndh4 和 ycfl 5 个 高 变异 区 域 ， 可 作为 鉴定 龙 万 亚 属 植物 的 潜 
在 分 子 标记 。 (6) 系统 发 育 分析 揭 示 了 西南 牡 项 在 龙 芒 亚 属 中 的 系统 位 置 及 芒 属 内 各 亚 属 
的 系统 发 育 关系 。 该 研究 为 草 属 植物 后 续 的 分 子 标记 开发 和 系统 发 育 研 究 芮 定 了 基础 。 
关键 词 : 西南 牡 葛 ， 叶 绿 体 基因 组 ， 密 码 子 使 用 偏 性 ， 分 子 标记 ， 系 统 发 育 分 析 
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Chloroplast genome features and phylogenetic analysis of 


Artemisia parviflora 
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C College of Agriculture and Biological Science, Dali University, Dali 671003, Yunnan, China) 
Abstract: To explore the structural features of Artemisia parviflora chloroplast genome and its 
systematic position. We employed high-throughput sequencing technology for genome sequencing 
and analyzed by bioinformatics tools. The results were as follows: (1) The chloroplast genome of 
A. parviflora was 151 047 bp, with a typical circular double-stranded tetrad structure, and the GC 
content was 37.596. (2) Total 115 unique genes were annotated, including 81 protein-coding genes, 
four rRNA genes, and 30 tRNA genes. (3) Sixty-eight simple sequence repeats (SSRs) and 37 long 
repeat sequences were detected. (4) The codon usage bias was weak in the A. parviflora 
chloroplast genome, and natural selection mainly contributed to the codon usage bias. 
High-frequency codons tend to ended with A/U. (5) There was no obvious expansion or 
contraction of the inverted repeat (IR) regions. Five high variation regions (trnH-psbA, 
rpll6—rps3, ycfl5-trnL-UAG, ndhA, and ycf1) were identified which could be used as potential 
molecular markers for identifying Subgen. Dracunculus species. (6) Phylogenetic analysis 
revealed the systematic position of A. parviflora within Subgen. Dracunculus and elucidated the 
phylogenetic relationships among the various subgenera of Artemisia. This study lays the 
foundation for future molecular marker development and phylogenetic research of Artemisia 
species. 
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叶绿体 是 植物 进行 光合 作用 的 主要 场所 ， 是 拥有 相对 独立 遗传 物质 的 半 自 主 性 细胞 器 。 
植物 的 叶绿体 基因 组 大 小 一 般 在 140~160 kb 之 间 ， 呈 现 为 由 四 部 分 组 成 的 环 状 双 链 结构 ， 
大 约 编码 了 110~130 个 基因 ,按照 基因 功能 可 以 分 为 4 类 ( 朱 婷 婷 等 ,2017; 林 楚 航 等 ,2023)。 
与 核 基因 组 相 比 ， 叶 绿 体 基因 组 具有 基因 组 较 小 、 拷 贝 数 高 及 进化 速率 适中 等 优点 ， 常 被 
于 不 同 分 类 等 级 的 系统 发 育 研 究 ( 樊 守 金 和 郭 秀 秀 ，2022) 。 另 外 ， 叶 绿 体 基因 组 的 简单 
复 序 列 (simple sequence repeats, SSRs) ~ 序列 差异 性 、 核 音 酸 多 态 性 及 密码 子 使 用 偏 性 等 
特征 可 为 物种 鉴定 和 进化 生物 学 研究 提供 关键 信息 。 近 年 来 , 随 着 高 通 量 测序 技术 的 快速 发 
展 ， 更 多 的 植物 叶绿体 基因 组 序列 被 测序 ， 并 ) 泛 应 用 于 系统 发 育 研究 o Song 等 〈2022 ) 
利用 木 姜 子 属 (Litsea) 物 的 叶绿体 基因 组 数据 明确 了 该 属 内 的 系统 发 育 关系 。 Qian 等 (2022 ) 
dk HEP Gladiolus gandavensis) 叶绿体 基因 组 的 分 析 ， 证 实 了 唐 曹 蒲 可 能 起 源 于 南非 
3 EE (Gladiolus) 53&2L1eJ& (Crocus) 的 同 源 性 更 高 ， 而 与 总 尾 属 (jris) 的 同 源 
性 较 低 。 可 见 ， 叶 绿 体 基因 组 序列 可 以 促进 高 等 植物 的 系统 发 育 研 究 。 

m (Artemisia) 是 菊 科 中 物种 最 丰富 且 分 布 最 广泛 的 属 之 一 ， 世 界 约 有 500 种 ， 主 要 
分 布 在 欧洲 、 亚 洲 和 北美 的 温带 地 区 ， 中 国 约 分 布 186 种 和 44 变种 (Bora & Sharma, 2011; 
冉 然 ，2022) 。 荔 属 植物 中 富 含 的 糖 类 、 莫 类 及 黄酮 类 等 多 种 化 学 成 分 在 抗 寄生 虫 、 抗 疙 疾 
和 抗 COVID-19 等 方面 具有 显著 的 药 用 价值 (Bisht et al., 2021) 。 然 而 ， 由 于 缺乏 明显 的 分 
类 特征 和 频繁 的 自然 杂交 ， 瘤 属 内 的 系统 发 育 关 系 一 直 存 在 争议 〈Kim etal., 2020) 。 林 有 
润 〈1995) 根据 形态 和 地 理 分 布 等 特征 ， 将 芒 属 划分 为 3 个 亚 属 和 9 个 组 。 芍 亚 属 (Subgen. 
Artiemisia) 、 龙 万 亚 属 (Subgen. Dracunculus) ~ WE HEJS (Subgen. Absinthium) F025 S 
亚 属 (Subgen. Seriphidium) 是 最 早 被 提出 的 4 odd 随 着 不 同 分 类 学 家 的 深入 研究 ， 
Subgen. Tridentatae 和 Subgen. Pacifica 也 被 提出 (Mcarthur et al., 1981; Hobbs & Baldwin, 
2013) 。 Jiao 等 (20230 基于 核 基 因 组 单 核 苔 — 性 Csingle nucleotide polymorphism, SNPs) 
2c BRT 73. 8 个 亚 属 ,发 现 大 多 数 先 前 被 认可 的 亚 属 并 非 单 系 类 群 ,， 并且 传 统 上 用 
亚 属 分 类 的 形态 特征 与 新 的 系统 发 育 树 不 相符 。 此 外 ,基于 叶绿体 基因 组 数据 的 研究 结果 表 
明 龙 葛 亚 属 为 单 系 类 群 , 但 该 亚 属 内 的 龙 葛 组 CSect. Dracunculus ) M4 H CSect. Latilobus ) 
均 为 多 系 类 群 , 这 与 传统 的 形态 分 类 结果 存在 一 定 的 分 歧 (Kim etal., 2020; Yu et al., 2022). 
由 此 可 见 , 蔽 属 内 各 亚 属 的 划分 一 直 不 明确 , 分子 分 类 结果 与 形态 分 类 结果 之 间 存 在 明显 分 
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Hat (Artemisia parviflora) 是 一 种 多 年 生 草 本 植物 ， 主 要 分 布 在 海拔 2 200-3 100 
米 的 草丛 、 坡 地 、 林 缘 和 路 旁 地 带 〈 林 包 和 林 有 润 ，1991) 。 目 前 ， 对 于 西南 牡 蒿 的 研究 主 
要 集中 在 其 化 学 成 分 和 药 用 价值 方面 (Ahameethunisa & Hopper, 2012; 周 利 娟 等 , 2012; Irum 
et al., 2017) ， 而 关于 其 系统 发 育 关系 的 研究 相对 较 少 。Masuda 5$ (2009) 利用 核糖 体 DNA. 
的 ITS KIRAI ETS 区 域 构建 系统 发 育 树 ， 发 现 西南 特 太 与 蒿 亚 属 的 插 蔽 (4. princeps) 和 亚洲 
大 花蕊 (4. macrantha) R 7j— X» 而 Jiao 等 (2023 ) 基于 核 基因 组 SNPs 数据 构建 系统 发 育 树 ， 
URM HASARRE SA. mairei) 亲 缘 关 系 最 近 。 据 中 国 植 物 志 记载 ， 目 前 
西南 牡 蔽 被 划分 在 龙 万 亚 属 的 牡 蔽 组 内 ， 由 于 西南 牡 万 的 形态 特征 与 其 近 缘 种 牡 蔽 (4. 
japonica) 十 分 相似 ， 还 曾 被 认为 是 特 蒿 的 变种 〈( 林 锻 和 林 有 润 ，1991) 。 因 此 ， 有 必要 利 
用 叶绿体 基因 组 数据 来 研究 西南 牡 苗 的 系统 位 置 及 芍 属 内 各 亚 属 的 系统 发 育 关 系 。 

本 研究 利用 高 通 量 测序 技术 获取 西南 牡 蔽 的 叶绿体 基因 组 序列 , 并 运用 生物 信息 学 软件 
进行 分 析 ， 拟 探究 以 下 科学 问题 : (1) 西南 牡 蔽 叶绿体 基因 组 的 结构 特征 ; (2) 西南 牡 项 
叶绿体 基因 组 的 密码 子 使 用 偏 性 特征 及 影响 因素 ; G) 开发 鉴定 龙 蒿 亚 属 植物 的 潜在 分 子 
标记 ; (O 探讨 西南 牡 蒿 的 系统 位 置 及 蒿 属 内 各 亚 属 的 系统 发 育 关 系 。 以 期 为 蒿 属 植物 后 
续 的 分 子 标记 开发 和 系统 发 育 研究 商定 基础 。 


1 材料 与 方法 


1.1 材料 
西南 牡 葛 的 新 鲜 叶 片 采 自 云南 省 丽江 市 丽江 高 山 植 物 园 (100920'05" E, 26999'68" ND ， 
海拔 3 223 m， 保 存 于 -80 °C 的 液 氮 中 冷藏 以 备用 。 
1.2 测序 及 组 装 注释 分 析 

对 样品 进行 DNA 提取 并 质 检 ， 构建 测序 文库 后 采用 Ilumina HiSeq "MM 平 台 测 序 。DNA 
提取 和 测序 工作 由 上 海 元 苹 生 物 医 药 科技 有 限 公司 完成 。 对 测序 数据 进行 质 控 和 评估 后 , 运 
用 GetOrganelle 软件 (Jin et al., 2020 ) 进 行 组 装 ,组 装 结果 使 用 Bandage 软件 CWick et al., 2015) 
进行 查看 和 校正 。 使 用 Plattid genome annotator (PGA) 软件 (Qu et al., 2019) 进行 注释 ， 
然后 用 Geneious 软件 (Kearse et al., 2012) 手动 检查 。 组 装 注释 的 fasta 文件 和 GenBank X 
件 已 提交 至 NCBI GenBank 数据 库 ，GenBank 登录 号 为 OP837546。 利 用 OGDRAW 在 线 软 
ft (Greiner et al., 2019) 绘制 叶绿体 基因 组 图 谱 。 
1.3 重复 序列 分 析 

使 用 MISA 在 线 软件 (Beier et aL, 2017) 检测 简单 重复 序列 ， 设 置 最 小 重复 次 数 : 单 核 
苷 酸 为 10, 二 核 背 酸 为 $, 三 核 苷 酸 为 4, 四 核 苷 酸 \ 五 核 背 酸 和 六 核 昔 酸 均 为 3。 使 用 REPuter 
在 线 软件 (Kurtz et al., 2001) 检测 长 重复 序列 ， 设 置 最 小 重复 长 度 为 30 bp，Hamming 距离 
为 3。 
1.4 密码 子 使 用 偏 性 分 析 

去 除 重 复 和 小 于 300 bp 的 和 蛋白 编码 序列 ， 运 用 CodonW (http://codonw.sourceforge.net) 
软件 统计 54 条 和 蛋白 编码 序列 的 有 效 密码 子 数 Ceffective number of codons, ENC) 和 相对 同 
义 密码 子 使 用 度 Crelative synonymous codon usage, RSCU) . RSCU 值 是 指 密码 子 的 实际 使 
用 频率 与 理论 使 用 频率 之 比 ， 用 于 衡量 密码 子 的 使 用 偏 性 〈 毛 立 彦 等 ，2022) 。RSCU>1 X 
明 该 密码 子 使 用 偏 性 强 ， 称 为 高 频密 码 子 ; RSCU<1 表示 该 密码 子 使 用 偏 性 较 弱 ， 称 为 低频 
密码 子 。ENC 值 用 于 反映 密码 子 使 用 偏 性 程度 ， 理 论 取 值 范 围 为 20~61，ENC 值 越 小 表明 
密码 子 使 用 偏 性 越 强 (Mcinerney, 1998; 王 飞 等 ，2022) 。 根 据 陆 奇 丰 等 〈2023 ) 的 方法 计 
算 ENC 期 望 值 和 ENC 比值 。 使 用 EMBOSS 网 站 (Rice et al., 2000) 的 cusp 程序 计算 第 1/2/3 
位 密码 子 的 GC 含量 CGCI/GC2/GC3) . GCI2 表示 GCI 与 GC2 的 平均 值 。 
1.5 序列 差异 分 析 及 IR 边界 分 析 

利用 mVISTA 在 线 软 件 (Mayor et al., 2000) ， 在 Shuffle-LAGAN 模型 下 进行 序列 差异 
分 析 。 使 用 DnaSP 6 软件 CRozas et al., 2017) 计算 核 苷 酸 多 态 性 , 滑动 窗口 长 度 设 为 600 bp, 
步 长 设 为 200 bp。 利 用 IRscope 在 线 软件 CAmiryousefi et al., 2018) 进行 IR 区 边界 收缩 与 扩 
张 分 析 。 
1.6 系统 发 育 分 析 

从 NCBI 数据 库 中 下 载 已 近 报 道 的 52 种 近 缘 蒿 属 植物 叶绿体 基因 组 序列 。 利 用 MAFFT 
软件 (Katoh et al., 2002) 进行 多 序列 比 对 。 利 用 MEGA 软件 (Kumar etal., 2008) (基于 
GTR + G+I 模 型 ) 构建 最 大 似 然 树 ，Bootstrap 值 设置 为 1000。 利 用 MrModeltest 2 软 伯 
(Nylander, 2004) 筛选 最 优 核 背 酸 替代 模型 为 GTR +G +1, 使 用 MrBayes 3.2 软件 (Ronquist 
et al., 2012) 构建 贝 叶 斯 树 ， 参 数 设 置 : 马尔 可 夫 链 运算 10 000 000 代 ， 每 1 000 代 取 样 1 
次 。 


2 结果 与 分 析 


2.1 西南 特 蒿 叶绿体 基因 组 的 基本 特性 

西南 牡 蔽 的 叶绿体 基因 组 长 151 047 bp， 呈 现 为 由 四 部 分 组 成 的 环 状 双 链 结构 ， 由 两 个 
有 反 向 重复 区 Cinverted repeat) (IRa 和 IRb) 、 一 个 PR. x ies Me copy, LSC) 
及 一 个 小 单 找 贝 区 (small single copy; SSC) 组 成 (图 1) 。 量 和 AT 含量 分 别 为 37.5% 
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和 62.5%, IR X, LSC 区 及 SSC 区 的 GC 含量 分 别 为 43.1%、35.6% 及 30.7% (CR 1) 。 共 
注释 出 115 个 基因 ， 包括 81 个 蛋白 编码 基因 、4 个 rRNA 基因 和 30 个 tRNA 基因 ( 表 2) 。 


其 中 有 19 个 基因 具有 内 含 子 ，ycp 基因 和 clpP1 基因 具有 2 个 内 含 子 ， 其 余 基因 只 有 1 个 
内 含 子 。 
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西南 牡 项 叶绿体 基因 组 


A. parviflora chloroplast genome 


151 047 bp 
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Bl 光合 系统 1 Photosystem I 
国 光 全 系统 ll Photosystem 11 
[E] 细胞 色素 b/f 复 合 物 Cytochrome b/f complex 
[E] ATP 合 成 酶 ATP synthase 
E] NADH RN NADH dehydrogenase 
国 — eiii OLEI XE RubisCO large subunit 
Bl ose RNA polymerase 
国 tecti AE ÉI Small subunit of ribosomal proteins (SSU) y 
Bl 核糖 体 蛋白 大 亚 基 Large subunit of ribosomal proteins (LSU) $ 
转运 RNA Transfer RNAs 
核糖 体 RNA Ribosomal RNAs 
clpP , matK 
Bl 其 他 基因 Other genes 
假定 叶绿体 阅读 框 (ye/) Hypothetical chloroplast reading frames (yc/) 


图 1 西南 牡 蒿 叶绿体 基因 组 图 谱 


Fig.l Gene map of the Artemisia parviflora chloroplast genome 


de 1 西南 牡 蒿 叶绿体 基因 组 基本 特征 


Basic features of the Artemisia parviflora chloroplast genome 


指标 Index 数值 Value 


Table 1 


起 因 组 大 小 Genome size (bp) 151 047 
LSC 区 长 度 Length of LSC region (bp) 82 833 
IR 区 长 度 Length of IR region (bp) 24 953 
SSC 区 长 度 Length of SSC region (bp) 18 308 
总 GC 含量 Total GC content (96) 37.5 
LSC [X GC & & GC content of LSC region (96) 35.6 
IR [X GC 含量 GC content of IR region (%) 43.1 
SSC 区 GC 含量 GC content of SSC region (96) 


30.7 


ki [A] 2870 


Category of gene 
光合 作用 


Photosynthesis 


自我 复制 


Self-replication 


Cfi dA 
Other genes 
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Table 2 Functional classification statistics of genes of the Artemisia parviflora chloroplast 


genome 
车 因 分 组 基因 名 称 
Group of gene Gene name 


光合 系统 I 
Photosystem I 
光合 系统 M 
Photosystem II 


细胞 色素 bf 复合 物 
Cytochrome b/f complex 
ATP 合成 酶 
ATP synthase 
NADH 脱氧 酶 
NADH dehydrogenase 


二 磷酸 核 酮 糖 涛 化 酶 大 亚 基 
RubisCO large subunit 
RNA 聚合 酶 


RNA polymerase 
核糖 体 蛋白 小 亚 基 
Small subunit of ribosome (SSU) 


核糖 体 蛋 白 大 亚 基 
Large Subunit of ribosome (LSU) 


转运 RNA 
Transfer RNAs 


核糖 体 RNA 
Ribosomal RNAs 
乙酰 辅酶 A 羧 化 酶 
Subunit of 


acetyl-CoA-carboxylase 
C Hz 胞 色素 合成 


psaA, psaB, psaC, psal, psaJ 


psbA, psbB, psbC, psbD, psbE, psbF, 
psbH, psbl, psbJ, psbK, psbL, psbM, 
psbN, psbT, psbZ 

petA, petB", petD' , petG, petL, petN 


atpA, atpB, atpE, atpF' , atpH, atplI 


ndhA' , ndhB'(x2) , ndhC, ndhD, ndhE, 
ndhF, ndhG, ndhH, ndhl, ndhJ, ndhK 


rbcL 


rpoA, rpoB, rpoC1*, rpoC2 


rps2, rps3, rps4, rps7(X2), rps8, rpsll, 
rps12'(x3), rps14, rps15, rps16*, rps18, 
rps19 

rpl2'(x2), rpll4, rpl16", rpI20, rpl22, 
rpl23(x2), rpl32, rpl33, rpl36 


trnA-UGC' (x2), trnC-GCA, trnD-GUC, 
trnE-UUC, trnF-GAA, trnfM-CAU, 
trnG-GCC, trnG-UCCĂ, trnH-GUG, 
trnl-CAU(x2), trnI-GAU" (x2), 
trnK-UUU', trnL-CAA(x2), trnL-UAA", 
trnL-UAG, trnM-CAU, trnN-GUU(x2), 
trnP-UGG, trnQ-UUG, trnR-ACG(x2), 
trnR-UCU, trnS-GCU, trnS-GGA, 
trnS-UGA, trnT-GGU, trnT-UGU, 
trnV-GAC(x2), trnV-UAC', trnW-CCA, 
trnY-GUA 

rrn4.5(x2), rrn5(x2), rrn16(x2), 

rrn23' (x2) 


accD 


ccsÁ 


15 


12 


15 


11 


37 


Hk: 


C-type cytochrome synthesis 
WIE cemA 


Envelope membrane protein 


和 蛋白酶 clpP™ 


Protease 

翻译 起 始 因子 infA 
Translation initiation factor 

成 熟 酶 matK 


Maturase 


假定 叶绿体 阅读 框 (of) 


Hypothetical chloroplast reading 
frames (ycf) 


* 和 兰 表 示 该 基因 包 


2.2 重复 序列 分 析 


THE 
£URL- ECT ER 
及 AATAT/ATATT 的 重复 单元 占 比 达到 了 88.2%, RIH SSRs 偏 
37 个 长 重复 序列 ， 


西南 牡 蔽 的 叶 绿 
EE 复数 量 最 多 (42 个 ) ， 其 中 有 97.6% 的 单 核 音 酸 重复 为 


本 基因 组 中 共 检 测 到 68 个 SSRs 位 点 ， 


包括 19 个 正 向 重复 (forward repeat) 和 


其 中 大 前 


含 1 和 2 个 内 含 子 ; (x2) 和 (x3) 表 示 该 基因 有 2 和 3 个 拷贝 。 


Note: * and ** indicates the gene contains 1 and 2 introns; (x2) and (x3) indicates the gene has 2 and 3 copies. 


yofl, ycf2(2), ycf3", yofA, ycf15, ycfo8 7 


BALF LSC 区 。 单 核 
AT 型 ， 其 次 是 四 核 蔡 酸 习 


mu 


E 复 ( 表 3)。 有 趣 的 是 , A/T, AT/AT. AAT/ATT. AAAT/ATTT. AATT/AATT 


碱 基 。 共 检测 到 


向 使 用 A/T 
18 NEXE 


Hf (palindromic 


repeat) ， 没 有 检测 到 互补 重复 (complementary repeat) MR HER (reverse repeat) (图 2). 


Ks 


li 


SSRs 类 型 
SSR type 
FIZER 
Mononucleotide 
二 核 背 酸 
Dinucleotide 
三 核 昔 酸 


Trinucleotide 


VUE tr 


Tetranucleotide 


TEZER 
Pentanucleotide 
TECH ES 


Hexanucleotide 


的 长 度 主要 集中 在 30-40 bp 之 间 。 


表 3 西南 牡 莘 叶绿体 基因 组 SSRs 类 型 及 数量 


Table3 Type and number of SSRs of the Artemisia parviflora chloroplast genome 


重复 单元 


Repeat unit 


A/T 
C/G 


AT/AT 


AAG/CTT 
AAT/ATT 
AAAG/CTTT 
AAAT/ATTT 
AATC/ATTG 
AATT/AATT 


AATAT/ATATT 


AACTAT/AGTTAT 


mE 
量 


Number 


41 
1 
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N 上 上 


H EE (90) 
Ratio (96) 
97.6 
2.4 


100 


25 

75 
8.3 
41.7 
33.3 
16.7 


100 


100 


14 13 国正 向 重复 Forward repeat 


12 O 回 文 重复 Palindromic repeat 

10 9 
E 
E 8 7 
z 
dH 6 
R 4 

4 
2 2 


30~40 41~50 51~60 
K Length (bp) 


图 2 西南 牡 划 叶绿体 基因 组 长 重复 序列 类 型 及 数量 

Fig.2 Type and number of long repeat sequence of the Artemisia parviflora chloroplast genome 
2.3 密 子 使 用 偏 性 特征 及 影响 因素 分 析 
VU SERE ENC 值 为 52.21, 表明 其 密码 子 使 用 偏 性 较 弱 。 在 西南 牡 蔽 叶绿体 基因 组 中 
检测 到 28 个 高 频密 码 子 (不 包括 终止 密码 子 ) ， 其 中 15 个 以 如 结尾 ，11 个 以 A 结尾 ， 
2 个 以 G 结尾 ; 31 个 低频 密码 子 ， 其 中 16 个 以 C 结尾 ，11 个 以 G 结尾 ，1 个 以 U 结尾 ，3 
个 以 结尾 A (图 3) 。 表 明 其 高 频密 码 子 偏向 以 A/U 结尾 ， 而 低频 密码 子 偏 向 以 G/C 结尾 。 

密码 子 使 用 偏 性 受 多 种 因素 影响 , 其 中 自然 选择 和 突变 压力 是 主要 因素 。 中 性 绘图 分 析 
发 现 GC12 值 的 范围 为 0.306~0.550，GC3 值 的 范围 为 0.178~0.425， 大 多 数 基 因 都 位 于 
上 F 方 (图 4: A)。 回 归 曲 线 斜率 为 -0.239 5,. R2 3 0.044 4 表明 GC12 值 与 GC3 值 相关 性 不 
著 ， 密 码 子 使 用 偏 性 主要 受 自 然 选 择 的 影响 。ENC-plot 分 析 发 现 大 部 分 基因 位 于 标准 曲线 
下 方 , 即 ENC 实际 值 与 ENC 期望值 之 间 存 在 较 大 差异 , 进一步 说 明 自然 选择 发 挥 了 主要 作 
用 (图 4: B)。 此 外 ，ENC 比值 频数 分 布 分 析 发 现 有 21 个 基因 ( 占 比 38.9%) 位 于 组 距 为 
-0.05~0.05 的 范围 内 ， 表 明 这 些 基 因 的 密码 子 使 用 偏 性 受 突变 压力 的 影响 〈 表 4) 。 其 余 的 
33 个 基因 ( 占 比 61.1%) 位 于 此 区 间 之 外 ， 表 明 这 些 基因 的 密码 子 使 用 偏 性 受 自 然 选择 的 
影响 。 综 上 所 述 ， 自 然 选择 和 突变 压力 共同 影响 西南 牡 葛 的 叶绿体 基因 组 密码 子 使 用 偏 性 ， 
其 中 自然 选择 发 挥 了 主要 作用 。 


Ku X 


相对 同 义 密码 子 使 用 度 
Relative synonymous codon usage (RSCU) 


Ala Arg Asn Asp Cys Gln Glu Gly His lle Leu Lys Met Phe Pro Ser Thr Trp Tyr Val 


图 3 西南 牡 蒿 叶绿体 基因 组 相对 同 义 密码 子 使 用 度 分 析 
Fig.3 Analysis of relative synonymous codon usage of the Artemisia parviflora chloroplast 


genome 
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A. 中 性 绘图 分 析 ; B. ENC-plot 分 析 。 
A. Neutrality plot analysis; B. ENC-plot analysis. 


图 4 西南 牡 蒿 叶绿体 基因 组 密码 子 使 用 偏 性 影响 因素 分 析 


Fig.4 Analysis of codon usage bias factors of the Artemisia parviflora chloroplast genome 


R 4 ENC 比值 频数 分 布 
Table 4 Frequency distribution of ENC ratio 
组 限 组 中 值 组 数 组 频 
Class boundary Class middle value Number Class frequency (%) 


-0.15~-0.05 -0.1 3 5.6 


-0.05—0.05 
0.05—0.15 
0.15—0.25 
0.25—0.35 
0.85~0.95 


2.4 序列 差异 性 分 析 


21 
24 


38.9 

44.4 
1.9 
3.7 
5.6 


使 用 mVISTA HRR AHENTE, MUERES (Artemisia hancei) 的 叶绿体 基因 组 
行 序列 比 对 分 析 。 结 果 表明 这 些 叶 绿 体 基 


作为 参考 , 对 9 种 龙 芒 亚 属 植物 的 叶绿体 基因 组 
因 组 的 结构 和 基因 顺序 基本 相同 ， 非 编码 区 的 差异 怕 


FE 大 于 编码 区 ，IR 区 的 差异 性 明显 小 于 


LSC 区 和 SSC 区 (图 5) 。 核 苷 酸 多 态 性 分 析 显 示 ， 总 共 检 测 到 498 PESEMA, E 
酸 多 态 性 值 (P)) 的 范围 变化 为 0-0.009 72, 平均 值 为 0.001 10。 检测 出 5 个 P>0.005 的 高 变异 
区 域 ， 分 别 为 trnH -psb4、rpl16 -rps3、ycfl5 -trnL-UAG« ndhA 和 ycfl (图 6) 。 


Wi A. hancei DSA 
AK A. capillaris 
vbi A. desertorum 
Js A. dracunculus 
华北 米 项 A. giraldii 
gi A. japonica 
my A. ordosica 
died 4. scoparia 
西南 牡 项 A. parviflora 


matk qpoCt 


PS6 。 pabK psbl tmC-GCA psbM trnY-GUA qB 
— FCR EAE — 
ob ims CU pet tm GUE the- ute 


4k 8k 12k 16k 
pma api 
-—— . 
ps ae i SGE) poy mE gaa VHC apt 
- i rc 


HÆ Contig 
=> 基因 Gene 
E 外 显 子 Exon 
^o 非 翻译 区 UTR 
E 非 编码 区 CNS 
信使 RNA mRNA 


N6 ps: 2 vcra 
p519 tml-CAU 


116k 120k 124k 128k 


图 5 9 种 龙芯 亚 属 植物 叶绿体 基因 组 序列 比 对 分 析 
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Fig.5 Sequence alignment analysis of the nine Subgen. Dracunculus species chloroplast 


genomes 
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6 9 种 龙 蕊 亚 属 植物 叶绿体 基因 组 核 苷 酸 多 态 性 分 析 


Fig.6 Nucleotide polymorphism analysis of the nine Subgen. Dracunculus species chloroplast 


genomes 


2.5 IR 区 边界 分 析 
9 种 龙 蒿 亚 属 物种 叶绿体 基因 组 的 IR 区 长 度 在 24 953-24 972 bp ZE, IR 区 边界 的 基 


因 差 异 相对 较 小 〈 图 7) 。 


BEE (Artemisia ordosica) 外 ， 其 余 物 种 的 LSC 区 与 IRb 区 


边界 ILB) 均 位 于 rps19 基因 内 。 所 有 物种 的 LSC 区 与 IRa 区 边界 OLA) 均 位 于 rph Æ 


因 和 tw 玖 基因 之 间 。 所 有 物 利 
种 的 IRb 区 与 SSC 区 边界 OSB) 均 距离 ndhF 基因 
基因 组 IR 区 的 长 度 和 边界 基因 


HAJ SSC 区 与 Ra 区 边界 ISA) 均 位 于 ycfl 基因 内 。 所 有 物 


41~72 bp 不 等 。 这 表明 西南 牡 蒿 叶绿体 


象 。 然 而 ， 黑 沙 蔓 的 IR 边界 与 其 他 物种 相 比 存在 明显 的 收缩 现象 。 
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7 9 种 龙 芒 亚 属 植物 叶绿体 基因 组 IR 区 边界 比较 分 析 


Fig.7 Comparative analysis of the IR region boundaries of nine Subgen. Dracunculus species 


chloroplast genomes 


2.6 系统 发 育 分 析 

基于 53 种 万 属 植物 叶绿体 基因 组 的 蛋白 编码 序列 ， 以 亚 菊 属 (hjania) B2 NE 28 
(Ajania tenuifolia) 和 丝 裂 亚 菊 (4. nematoloba) 作 为 外 类 群 ， 利 用 贝 叶 斯 法 (BI〉 和 最 大 似 
然 法 (ML) 构建 系统 发 育 树 。 结 果 表明 2 种 建树 方法 产生 相同 的 拓扑 结构 且 多 数 节 点 都 具 
有 较 高 的 支持 率 〈 图 8) 。 根 据 Jiao 等 (2023) 对 亡 属 内 各 亚 属 的 最 新 划分 ， 本 研究 中 的 万 
属 物种 主要 分 为 $ 个 分 文 , 包 括 蘑 亚 属 、 龙 项 亚 属 、 本 蔓草 亚 属 、 绢 萝 亚 属 及 Subgen. Ponticae 
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RNT TX, HAHAERERAA XL AALEN. W^. IAKS CA. 
giraldii) J CA. dracunculus) 聚 为 一 文 ， 位 于 该 亚 属 分 支 的 基部 。 
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图 8 基于 叶绿体 基因 组 蛋白 编码 序列 构建 蒿 属 系统 发 育 树 
Fig.8 Phylogenetic tree of Artemisia based on the protein-coding sequences of chloroplast 


genomes 


3 讨论 与 结 


通过 比较 分 析 发 现 ,西南 牡 项 叶绿体 基因 组 
属 植物 相似 〈 刘 潮 等 ，2023) E 
体 基因 组 相对 保守 。 此 外 ， 与 LSC 
这 可 能 与 IR 区 域内 包含 高 GC 含量 的 RNA 基因 
植物 中 也 发 现 了 类 似 的 现象 (Wu et al., 2020; Zhang et al., 2023) , 表明 IR 
基因 组 结构 稳定 方面 
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区 和 SSC 区 相 比 ， 


在 长 度 、 HAREAREN h 
LIR 区 边界 未 发 现 明 显 的 扩张 或 收缩 ， 表 明 西 南 牡 芯 叶 绿 


与 之 前 报道 的 


的 GC 含量 最 高 且 序 列 差 异性 最 
含量 为 55.1%) 有 关 。 且 在 其 他 
又 在 维持 叶绿体 


] 仿 性 是 指 编码 同一 种 氨基 酸 的 多 个 同 义 密码 子 的 使 


用 偏 


性 受 


期 进化 的 结果 ， 
Wang et al., 2023) 。 本 研究 发 现 西南 牡 蒿 叶绿体 基 
用 A/U 结尾 。 这 与 黑 沙 蕊 和 华北 米 蒿 等 龙 蒿 亚 属 植物 的 密码 子 使 用 偏 性 特征 
2022) 。 该 物种 38.9% 的 基因 


K 


] 频 率 不 同 , 这 古物 


与 基因 的 功能 与 表达 密切 相关 (Najafabadi et al., 2009; Zhang et al., 2018; 


然 选 择 影响 。Nie 等 


密码 子 使 用 偏 
(2014) 对 菊 科 植物 叶绿体 基因 组 


性 受 突变 压力 影 


因 组 的 密码 子 


使 用 偏 性 较 弱 ， 且 偏向 使 
相似 《〈 冉 然 等 ， 
而 有 61.1% 的 基因 密码 子 使 


LP 


密码 子 使 用 偏 性 的 影响 因 


素 分 析 也 表明 自然 选择 是 主导 因素 。 然 而 ， 沈 宗 芳 等 〈2021) WARME (Drynaria) 


植物 叶 绿 


体 基因 


组 的 密码 子 使 


可 能 会 


有 具有 相似 


的 密码 子 使 


叶 绿 


体 基因 


组 的 SSRs 


定 、 遗 传 关 系 研究 及 分 子 标记 加 
在 西南 牡 蒿 叶绿体 基因 组 
较 大 差异 。 在 五 月 艾 CA. indica) 、 


j 仿 性 主要 受到 突变 压力 的 影响 。 这 表明 亲缘 关系 相近 的 物 
日 模式 。 


具有 共 显 性 遗传 、 高 重复 性 和 高 变异 性 等 特点 ， 常 被 


助 育种 等 方面 的 


EVI SE 


高 效 分 子 标记 (Kaur et al., 2015) 。 本 研究 


发 现 了 68 个 SSRs 位 点 , ZAT A I|] es Jes b 


TES (A. taneutica) 、 


SSRs 的 数量 存在 
华北 米 芍 及 黑 沙 葡 中 分 别 检测 


到 191 个 、201 个 、39 个 及 47 个 SSRs 位 点 ， 这 说 明 不 同 蒿 属 物种 的 SSRs 突变 频率 存在 一 
定 差 异 〈 兰 朝 辉 等 ，2022; Yu et al., 2022; 冉 然 ，2022) 。 这 一 现象 在 梧桐 属 (Firmiana) 


和 丝 兰 属 CYucca) 植物 叶绿体 基因 组 中 同样 存在 〈 陆 奇 丰 等 ，2021; 王 飞 等 ，2023) 。 此 


yb. A 


RERM- BEREZ H 
2023) . Am SIZAR (Prinsepia) 和 柴 胡 属 


P 
Ax, 


HERMT FE EE ES HER 


体 基 因 组 


单 核 昔 酸 重复 的 SSRs 最 为 丰富 ， 其 次 是 四 核 苷 


fé 8] 


使 用 AT RE, ix 5H 


we 


SRE ØA ARARA Ch 


(Bupleurum) WHARA, TEE 


中 并 未 观察 到 随 着 拷贝 数目 增加 而 SSRs 数量 明显 减少 的 情况 CE KE, 2022; 张 明 英 等 ， 


20010 。 总 之 ， 本 研究 结果 有 峡 


叶 绿 


本 基因 组 


于 未 来 万 属 植 物 的 SSRs 分 


c 


子 标记 开发 和 遗传 多 样 性 研究 。 


统 发 育 研究 


的 系统 发 育 有 
快 ， 包 含 大 量 


究 ， 例 如 目 
变异 位 点 ， 适 月 
分 类 〈Shaw et al., 2007; 刘 静 
非 编码 区 差异 性 明显 高 于 编 
r (Liu etal., 2013; Shen et al., 2017) 。 值 得 


的 编码 区 与 非 编码 
CETERE, 20220 。 编 码 
和 科 的 分 类 (Li etal., 2019) 。 相 反 ， 非 编 
的 系统 发 育 研究 ， 
等 ，2012) 。 本 研究 发 现 9 种 龙 蒿 亚 属 植物 叶绿体 基因 序列 的 


日 于 低级 分 类 水 


区 的 分 子 进 化 速率 存在 差异 , 适用 了 
区 的 进化 速度 相对 


不 同 分 类 水 平 的 系 
较 慢 ， 适 用 于 高 级 分 类 水 平 
码 区 的 进化 速度 相对 较 
网 如 ， 属 、 种 及 种 下 等 级 的 


码 区 , 这 与 先前 在 大 多 数 芍 属 植物 中 观察 到 的 序列 差异 性 规律 一 


提 的 是 ， 本 


研究 还 鉴定 出 5 个 高 变异 区 域 ， 


分 别 为 trnH-psbA. rpll6—rps3 ~ ycf15-trnL-UAG ~ ndhA 和 ych。 刘 涛 等 (2009) 利 用 trnH-psbA 


yfl KRAER 


AET m ELI 


(2020) 研究 表明 accD 基因 


也 观察 到 了 类 似 的 高 度 变异 必 
和 ycfl AAM E SJR 


pO EISE IY Ew CA. anua). KRAMA CA. caruifolia) 。 此 外 ，trnH-psb4 和 
E (Shahzadi et al., 2020) . Kim 等 


表现 


科 植 物 核心 分 子 标记 的 潜力 。 因 此 , 本 研究 筛选 出 的 高 变 腊 


潜在 分 子 标记 。 


出 高 度 多 态 性 ， 而 且 具 有 成 为 菊 
区 域 可 作为 识别 龙 葛 亚 属 物种 的 


Zt 3t Ac HUE NE Jes RU EE 28 SIERI — 36. WEEE 
5 属 曾 被 认为 是 芒 亚 属 内 的 一 个 组 。Hobbs &Æ (2013) Bf 


Ly 


LRRRARRBOE, W TE 


WE FEES PI, 这 表明 这 两 个 
Ze 


yn 


CRIS Je UE JE RU SEE E EE J88 3] 7 E ERE. IX AIRE Jiao $ (2023) 基于 核 基 因 组 SNPs 数 
HRERS Tf JE is V Je V] 7930€ — A 4 S BU B2B, ZH eg ME Jes ULT EHE RI] e 
部 ， 这 结果 与 Jin & (2023) 基于 叶绿体 基因 组 数据 的 研究 结果 相 一 致 ， 而 与 Jiao & (2023) 
基于 核 基 因 组 SNPs 数据 的 研究 结果 存在 差异 。 可 见 ， 核 基因 组 数据 和 叶绿体 基因 组 数据 在 
物种 系统 发 育 研究 中 既 表 现 出 一 致 性 又 存在 差异 性 。 虽然 ， 核 基因 组 具有 双亲 遗传 特性 ， 能 
够 揭示 双亲 谱系 的 进化 关系 ， 在 系统 发 育 研究 中 有 较 大 的 潜力 〈 王 杰 等 ，2023) ， 但 叶绿体 
基因 组 数据 丰富 ， 目 前 仍然 是 植物 系统 发 育 研 究 的 主要 方法 。 此 外 ,还 发 现 原 为 绢 匾 亚 属 的 
—ARUT ZB ER. jurceg 则 与 时 葛 功 亚 属 物种 聚 为 一 文 。 这 结果 支持 Malik 等 (2017) 将 三 裂 
叶 绢 万 从 绢 划 亚 属 中 移 除 的 结论 。 本 研究 基于 所 有 已 经 公布 的 万 属 植物 叶绿体 基因 组 数据 对 
琅 属 内 各 亚 属 进行 重新 划分 , 尽 可 能 保证 各 亚 属 的 单 系 性 , 可 为 蓝 属 内 各 亚 属 的 分 类 修订 提 
供 基础 。 

本 研究 还 发 现 西 南 牡 蔽 与 雷 琼 牡 万 亲缘 关系 最 近 ， 两 者 同属 于 牡 蒿 组 。 然而 ,西南 牡 蔽 
曾 被 认为 是 牡 芒 的 变种 ， 后 来 以 西南 牡 葛 的 茎 下 部 时 一 至 二 回 羽 状 深 裂 或 全 裂 ， 中 部 时 3~5 
RA; 茎 、 枝 、 叶 背面 初时 被 黄色 或 褐 黄色 和 柔 毛 等 特征 ， 将 其 与 牡 葛 区 分 开 来 〈 林 久 和 林 有 
润 ，1991) 。 本 研究 的 分 子 系统 发 育 分 析 表 明 西 南 牡 蒿 与 牡 蒿 亲缘 关系 较 远 ， 它 并 非 牡 蒿 的 
变种 。 此 外 ， 本 研究 还 发 现 龙 葛 亚 属 内 的 龙 葛 组 和 牡 葛 组 均 呈 现 多 系 性 ， 这 与 最 新 的 分 子 系 
统 发 育 研究 结果 一 致 (Kim etal., 2020; Yu etal., 2022; Jin etal., 2023) ， 但 与 传统 的 形态 
学 分 类 结果 存在 一 定 的 分 歧 。 因此 , 对 于 蔽 属 系统 发 育 的 研究 需要 结合 形态 特征 和 更 多 的 分 
子 数据 以 提供 全 面 的 支持 。 

综 上 所 述 , 本 研究 首次 报道 了 西南 牡 太 叶绿体 基因 组 序列 , 并 分 析 了 其 结构 特征 和 蔽 属 
的 系统 发 育 关系 。 结 果 表 明 ， 西 南 牡 蒿 叶绿体 基因 组 的 大 小 、 结 构 及 IR 区 边界 相对 保守 。 
密码 子 使 用 偏 性 较 弱 ， 主 要 受 自 然 选 择 的 影响 。 此 外 ， 筛 选 得 到 的 重复 序列 和 高 变异 区 域 可 
芷 为 鉴别 萝 属 植物 的 潜在 分 子 标记 。 系 统 发 育 分 析 揭 示 了 西南 牡 葛 的 系统 位 置 及 芍 属 内 各 亚 
属 的 系统 发 育 关 系 。 这 些 结果 为 深入 研究 蔽 属 植物 的 进化 特征 和 系统 发 育 关 系 提供 了 重要 参 
考 。 
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